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Abstract (Basic) : EP 519802 A 

The voice synthesis technique includes initial digitising of a 
natural voice signal. This signal is then cut using a base of 
orthogonal wavelets with a compact support. The coefficients 
representing the voice signl are then stored. 

The voice signal may then be reconstituted using these 
coefficients in a process of filtering, interpolation and low frequency 
amplification. The choice of regularity of the synthesis wavelets is 
determined by a preliminary analysis of the speech frames. 

USE/ADVANTAGE - E.g. for voice control system for vehicle, or 
industrial process. Simple processing system of reduced cost using 
widely available components. Reduced memory for message storage. 
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(54) Procede de synthese vocale a I'aide d'ondelettes. 



(57) La synthese vocale de invention consiste a 
analyser un signal vocal par decomposition 
orthogonale sur une base d'ondelettes a sup- 
port compact, de preference des ondelettes de 
Daubechies. La synthese est effectuee a partir 
des coefficients stockes et selectionnes lors de 
I'analyse, selon le meme algorithme que celui 
utilise pour I'analyse. 
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La presente invention se rapporte a un procede 
de synthese vocale. 

Parmi les nombreux domaines d'application de la 
synthese vocale, certains, tets que les appareils a 
commande interactive (commande de vehicules, de 5 
processus industriels, ...) ne necessitent que la 
synthese de messages simples (mots isoles ou pha- 
ses predeterminees). Dans de telles applications, on 
recherche a minimiser le cout du dispositif de synthe- 
se vocale. La diminution du cout peut etre essentiel- 10 
lement obtenue par I'emploi de circuits de grande dif- 
fusion et par la diminution de la capacite de memoire 
necessaire au stockage des messages. 

Afin de reduire cette capacite de memoire, Tart 
connu fait appel a differents types de codage. Parmi 15 
les codages les plus employes, on connaft le codage 
temporel qui associe a ('amplitude du signal un code 
binaire a des instants discrets, et plus precisement, 
on memorise plutot la difference entre le signal et sa 
composante predictable (codage differentiel). On fait 20 
egalement appel au codage de la parole par analyse 
et synthese, selon lequel on ne stocke que tres peu 
de parametres significatifs (dispositifs dits : "voco- 
deur a canaux" ou "vocodeur a prediction lineaire"). 
On connaft enf in un procede qui resulte de I'associa- 25 
tion des deux procedes precites : "vocodeur predictif 
adaptatif" ou "a excitation vocale", en particulier le co- 
dage en sous-bandes. 

Dans le cas du codage en sous-bandes, qui est 
un codage dans le domaine frequentiel, on fractionne 30 
le spectre du signal a coder en un certain nombre de 
sous-bandes de largeur B k (egales entre elles ou 
non). Chaque sous-bande (d'indrce k) est ensuite ree- 
chantillonnee a la frequence de Shannon, soit 2B k . 
Les signaux issus de chaque filtre de sous-bande 35 
sont quantifies differemment en fonction de la fre- 
quence, a savoir quantification fine pour le fondamen- 
tal et les formants, et quantification grossiere dans les 
plages ou I'energie est faible. L'operation inverse est 
realisee pour reconstruire le signal. 40 

Avant stockage et transmission, les signaux sont 
codes par exemple selon une loi de codage MIC (mo- 
dulation par impulsions et codage) normalisee a 64 
kbits/s (signal echantillonne a 8 kHz sur 8 bits dans 
la bande 300-3600 Hz et compresse selon une loi lo- 45 
garithmique). Le codage MICDA (MIC differentiel 
adaptatif), a un debit de 32 kbits/s (8 kHz sur 4 bits), 
tend a se generalises 

On a represents en figure 1 le schema de principe 
d'un dispositif 1 de codage a deux sous-bandes. Le 50 
signal de parole x est filtre par deux filtres F1, F2 (de 
reponses impulsionnelles hi, h2). Chacune des deux 
sous-bandes en sortie de F1, F2 est decimee par 2 
(suppression d'un echantillon sur 2) par les circuits 2, 
3 respectivement, puis codee (4), par exemple en 55 
MICDA et stockee (ou transmise). A la lecture (ou re- 
ception), la reconstitution du signal de parole se fait 
par decodage (5, 6) puis f iltrage dans des interpola- 
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teurs (7, 8) identiques a ceux de la bande d'analyse 
correspondante et sommation (9) des deux sous- 
bandes decodees. Les filtres F1 et F2 sont des filtres 
FIR (a re pons e impulsionnelle f inie) a phase lineaire 
et satisfont aux conditions suivantes. 

h 2 (n) = (-1)nh1 (n) 
|H n (eJ9)|2 + |H 2 (eie)|2#1 
On a represents en figure 2 le gabarit de ces fil- 
tres. 

Le principe du codage en sous-bandes consiste 
a f iltrer le signal de parole par un banc de filtres, puts 
a sous-echantillonner les signaux de sortie de ces fil- 
tres. A la reception, la reconstitution se fait par addi- 
tion de chaque sous-bande decodee, interpolee par 
un filtre identique a celui de la bande d'analyse 
correspondante. Ce type de codage a d'abord ete im- 
plante a partir de filtres disjoints et contigus a reponse 
impulsionnelle finie. II a ensuite ete etendu grace a 
I'emploi de filtres miroirs en quadrature, permettant 
une reconstitution quasi parfaite du signal initial en 
1'absence d'erreur sur la quantification. 

II existe deux grandes families de procedes pour 
synthetiser les filtres qui decomposent le signal de 
parole : 

- soit on scinde I' entree en deux bandes par un fil- 
tre optimise, et on renouvelle ralgorithme pour 
chaque bande ; 

- soit on deplace sur I'axe frequentiel un gabarit 
de filtre passe-bande. Dans ce cas, le filtre de 
base est de reponse h(n) et de largeur de bande 
7i/2M (M etant le nombre de sous-bandes). Par 
deplacement, on obtient : 

h,(n) = h(n) . cos (n* (2i + 1)/2M) 
n etant la demi-frequence d'echantillonnage nor- 
malisee. Le pro bl erne de repliement des gabarits lors 
du sous-echantillonnage peut etre compense par un 
terme de phase dans la fonction cosinus de dephasa- 
ge. 

Le filtre demi-bande, dont le gabarit est represen- 
ts en figure 2, est classiquement un filtre lineaire dont 
la fonction de transfert vaut 1/2 a fe/4 (fe = frSquence 
d'echantilllonnage) et est antisymetrique par rapport 
a ce point, c'est-a-dire que Ton a : 



H^fe/4 + f j = 1 - H|fe/4 - fj 

Les coefficients h(n) sont nuls pour n pair, sauf 
ho. Le gabarit est def ini par I'ondulation en bandes 
passante et coupee, et par Af qui represente la largeur 
de la bande de transition. Le nombre N de coefficients 
du filtre en fonction du gabarit desire est donne par la 
relation approchee : 

dans laqueile 5 = - 5 2 represente I'ondulation dans 
les bandes passante et coupee. La reduction ou I'ele- 
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vation de la frequence d'echantillonnage sont obte- 
nues par la mise en cascade de P f iltres demi-bande. 
La frequence intermediate f i est un sous-multiple de 
la frequence d'echantillonnage dans un rapport 
deux : fe = 2 P . ft. 

II existe egalement des dispositifs procedant a 
I'analyse multiresolution du signal de parole, et 
comportant essentiellement un f iltre discret et un cir- 
cuit de "decimation" (suppression d'un echantillon sur 
deux). On connatt egalement ("Traitement de Signal", 
vol 7, n° 2, 1990), pour la compression numerique 
d'image, un algorithme rapide mettant en oeuvre une 
transformee en ondelettes, mais cet algorithme ne 
convient que pour des images (seule la composante 
HF est conservee). 

Les dispositifs connus sont soit trop rudimentai- 
res, et ne permettent pas d'obtenir a la restitution un 
signal de parole suffisamment intelligible, soit trop 
complexes et done onereux. 

La presente invention a pour objet un procede de 
synthese vocale qui permette de synthetiser le plus 
simplement possible des signaux de parole et ne fas- 
se appel, pour sa mise en oeuvre, qu'a des circuits 
existants et peu onereux. 

Le procede de I'invention consiste a numeriser un 
signal vocal, a decouperce signal numerise dans une 
base orthogonale d'ondelettes a support compact, a 
stockerles coeff icients representatifs du signal vocal, 
et, a la restitution, a reconstituer le signal vocal parfil- 
trage, interpolation et amplification basse frequence. 

Linvention sera mieux comprise a la lecture de la 
description detaillee d'un mode de realisation, pris a 
titre d'exemple non limitatif et illustre par le dessin an- 
nexe, sur lequel : 

- la figure 1, deja decrite ci-dessus, est un bloc- 
diagramme d'un systeme de codage connu ; 

- la figure 2 est un gabarit de f iltre demi-bande 
utilisable dans le systeme de la figure 1 ; 

- la figure 3 est un bloc-diagramme d'un systeme 
de synthese mettant en oeuvre le procede confor- 
me a I'invention ; 

- la figure 4 est un bloc-diagramme du dispositif 
d'analyse du systeme de la figure 3 ; 

- la figure 5 est un dia gramme illustrant I' algo- 
rithme de decomposition de I'invention ; 

- la figure 6 est un diagramme illustrant I' algo- 
rithme de reconstruction de I'invention ; 

- la figure 7 est un bloc-diagramme simplif ie d'un 
dispositif de synthese vocale mettant en oeuvre 
le procede de I'invention ; 

- la figure 8 est un chronogramme d'une fonction 
d'echelle et d'une ondelette utilisees par I'inven- 
tion ; et 

- la figure 9 est un schema d'un dispositif de 
synthese mettant en oeuvre le procede conforme 
a I'invention. 

Le synthetiseur de messages vocaux decrit ci- 
dessous comporte deux parties principals : une par- 



tie 14 d'analyse et une partie 15 de synthese vocale 
(figure 3). 

Dans la partie 14, les signaux de la source 1 6 (par 
exemple un microphone) sont quantifies, puis analy- 

5 ses en 17 et codes en 18. Les criteres pertinents qui 
en resultent sont stockes en 1 9 (par exemple des me- 
moires de type EEPROM). Toutes ces operations 
sont, dans le cas present, realisees en laboratoire. 
Dans la deuxieme partie, qui comporte le dispo- 

10 sitif de stockage 19, un dispositif 20 assure la recons- 
titution du signal & partir des coefficients selectionnes 
et stockes (en 19), le signal reconstitue est envoye & 
un amplif icateur 21 muni d'un haut-parleur. 

Selon I'invention, on met en oeuvre, pour le coda- 
is ge et la reconstitution, un algorithme qui decompose 
le signal vocal dans une base orthogonale d'ondelet- 
tes a support compact. Ces ondelettes sont par 
exemple des ondelettes de Daubechies (voir figure 
8); Seuls sont stockes les coefficients juges repre- 

20 sentatifs du signal vocal de depart et assurant une 
parfaite intelligibility du message reconstitue, ce qui 
limite fortement le debit des signaux a stocker. 

L'organigramme de la figure 4 illustre la procedu- 
re d'analyse vocale conforme a ('invention. 

25 Les signaux basse frequence produits par une 

source de signaux basse frequence 22 (capteur 
acoustique, moyen de stockage magnetique, ...) sont 
numerises (23), par exemple sur 1 6 bits, par exemple 
a I'aide d'un convertisseur "flash" ou d'un convertis- 

30 seur a approximations successives (dont le temps de 
conversion est de I'ordre de 60 us ou moins) a une fre- 
quence d'echantillonnage, qui est par exemple de 10 
kHz. Le signal echantillonne est ensuite decoupe en 
trames de, par exemple, 128 points (duree d'une tra- 

35 me : 12,8 ms). Selon un autre exemple, on peut met- 
tre en oeuvre des trames de 256 points, sans preju- 
dice notable pour la qualite de la restitution. Ensuite, 
on procede a ('analyse (24), qui constitue une etape 
essentielle de I'invention. Cette analyse consiste en 

40 particulier & decomposer le signal numerise sur une 
base orthogonale d'ondelettes a support compact, et 
fait appel a des f iltres dont la reponse impulsionnelle 
peut etre symetrique ou non. Dans le cas ou cette re- 
ponse est symetrique, on limite le stockage des coef- 

45 f icients extremes (responsables des effets de bords) 
a un seul cote du signal, I' autre cote etant deduit par 
symetrie (la periodicite des f iltres est implicite par 
construction). 

A partir des 128 points initiaux, on obtient done 

so par cette decomposition 128 combinaisons lineaires 
independantes de la base d'observation.La regularity 
de I'onde, qui conditionne la forme du f iltre de decom- 
position est un des deux parametres majeurs de la de- 
composition (avec le niveau de decomposition, qui 

55 conditionne la largeurdu f iltre). Parmi ces 128 combi- 
naisons, on en conserve par exemple 32 (estim£es 
etre les plus signif icatives) qui sont codees (25), dans 
le cas present sur 8 bits, ce qui donne un debit de va- 
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leurs a stocker de 20 kbits/s. La selection de 16 coef- 
ficients codes sur 16 bits ne modifierait pas le debit 
des valeurs a stocker, mais diminuerait la qualite du 
signal restitue. 

On notera que ('analyse par dilatation de I'echelle 
des temps (voirfonction d'6chelle, en trait inter rompu, 
en figure 8) est realisee non pas en dilatant les onde- 
lettes d'analyse, mais en sous-echantillonnant d'un 
facteur 2 P le signal a analyser. II en r6sulte, pour une 
decomposition a un niveau p, (p+1) jeux de coeffi- 
cients. De plus, la projection sur une base orthogona- 
le (a nombre de points = N/2 + N/4 + ... + N/2 P+1 ) n'in- 
duit ni perte ni redondance d'informations. La repre- 
sentation en ondelettes devient (Sj, Djfo^j ou S est 
['approximation du signal a la resolution 2i et les Dj 
correspondent aux details de resolution 21 

Les parametres ayant et6 codes (25), on procede 
toujours en laboratoire, avant de les stocker, a une 
evaluation (26), en r6alisant la synthase, comme d§- 
crit ci-dessous. Si (en 27) la qualite de la restitution du 
signal vocal est mauvaise, on modifie (28) le choix 
des parametres resultant de ('analyse (24), et on les 
code (25) pour une nouvelle evaluation (25). Si cette 
qualitee est jugee bonne, on met en forme les trames 
de parametres (29) et on transmet celles-ci, par 
exemple via une liaison serie RS422 (30), aux 
moyens de stockage. 

On a illustre en figure 5 la mise en oeuvre de I'al- 
gorithme de decomposition selon I'invention. 

Les differentes composantes So a Sj sonttraitees 
chacune de la meme fagon : convolution avec les 

(j+1 ) f iltres g (31 .o a 31 .j) et leurs 0+1 ) rniroirs res- 

pectifs (32.0 a 32J) H et decimation par 2 (respecti- 
vement 32.o a 32.j et 34.o a 34 j). 

Pour une r6gularite n, le support du f iltre compor- 
te 2.n valeurs. A partir des N coefficients de depart, 
on a pour n=1 2 fois N/2 coefficients, pour N=2, 4 fois 
N/4 coefficients, etc., mais on n'en stocke que N/2n. 
Si Ton prend par exemple n=6, on met en oeuvre une 
convolution sur 12 points. Cette valeur implique que 
la convolution est realis6e dans le domaine temporel. 
Cependant, pour une regularity superieure a environ 
16, il est preferable, du point de vue du temps de cal- 
cul du processeur d'analyse, de substituer a la convo- 
lution une multiplication dans I'espace frequentiel 
dual (ce qui revient a une convolution sectionnee). 

Le codage des parametres (en 25) peut etre rea- 
lise soit a partir d'histogrammes locaux, soit, de ma- 
nure plus simple, par une quantification liee a un ni- 
veau energetique fixe par avance. 

La phase devaluation (26) consiste a ecouter le 
message reconstitue, et, le cas ech6ant, si I'ecoute 
n'est pas jug6e satisfaisante, a modifier (28) les pa- 
rametres a stocker. Cette reconstitution se fait, 
comme d6crit ci-dessous en detail, par conversion 
numerique/analogique, filtrage passe-bas de lissage 



et amplification basse frequence. Lorsque la qualite 
du message reconstitue est jugee satisfaisante, on 
met en forme les coefficients (29) et on les charge 
(30) dans une memoire appropriee. La mise en forme 

5 consiste essentiellement a formatter les donnees, a 
produire les adresses correspondantes et a sequen- 
cer les trames successives de donnees. 

On a illustre en figure 6 1'algorithme de synthese 
vocale proprement dit mettant en oeuvre le procede 

10 de I'invention, qui constitue un moyen autonome de 
generation de messages, distinct du dispositif de 
synthese de laboratoire, mentionne ci-dessus t ayant 
servi pour revaluation du choix des parametres. Cet 
algorithme de synthese vocale reconstitue le signal 

15 d'origine en procedant par interpolation (35.o a 35.j 
pour So a Sj et 36.o a 36.j pour Do a Dj), filtrage (37.0 
a 37.j et 38.o a 38.j respectivement), addition (39.o a 
39J), multiplication (40.0 a 40.j) et amplification basse 
frequence. En effet, a partir de la decomposition en 

20 echelle-ondelette au niveau p (typiquement p=2 a 3), 
il est possible de reconstruire la decomposition au ni- 
veau (p-1). II suffit pour celad'inserer des valeurs nul- 
les entre chaque valeur de la decomposition au ni- 
veau p, puis de convoluer avec les fonctions ondelet- 

25 tes et echelles inverses selon I'algorithme de recons- 
truction detailie ci-dessus. 

Les ondelettes de Daubechies, que I'invention 
utilise preferentiellement, sont des ondelettes a sup- 
port compact, qui minimisent de ce fait le nombre de 

30 points de leur reponse impulsionnelle, done de la 
convolution. 

Les filtres de decomposition sont identiques a 
ceux de reconstruction, mais ils ne sont pas symetri- 
ques, ce qui oblige a memoriser les coefficients dus 

35 aux effets de bords au debut et a la fin de la trame de 
coefficients a memoriser. On peut contourner ce pro- 
bleme en utilisant des ondelettes bi-orthogonales, ce 
qui oblige alors a utiliser des filtres de reconstruction 
differents de ceux de decomposition, mais leur r6pon- 

40 se etant symetrique, seuls sont stock6s les coeffi- 
cients d'un seul cote. 

On a repr6sente en figure 7 le schema simplifie 
d'un dispositif de synthese vocale mettant en oeuvre 
le procede conforme a ('invention. Les coefficients 

45 des filtres de reconstruction sont stockes dans une 
memoire 41 et utilises par un calculateur specialise ou 
un microprocesseur 42 qui reconstruit le signal vocal 
sous la commande de ('algorithme de reconstruction 
d6crit ci-dessus et memorise dans sa memoire de 

so programme 43 avec les valeurs des reponses impul- 
sionnelles des differents filtres de reconstruction. Les 
valeurs numeriques du signal reconstruit sont 
converges en analogique par le convertisseur 44 qui 
est suivi d'un ampl'rf icateur 45 a f iltre analogique pas- 

55 se-bas (a frequence de coupure de 4 kHz par exem- 
ple) et a commande de gain 46. La sortie de Tampli- 
f icateur 45 est reliee a un haut-parleur 47. L'amplifi- 
cateur comporte avantageusement une sortie haute 
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impedance 48 qui peut etre reliee a un dispositif d'en- 
registrement approprie. Le microprocesseur 42 est 
par ailleurs relie & une entree 49 (par exemple entree 
serie RS232 ou RS422) par laquelle il regoit des de- 
mandes de synthese de messages vocaux. Ces de- 5 
mandes peuvent provenir de circuits d'alarme. 

Sur le schema detaille du dispositif de synthase 
vocale de la figure 9, on a represente le processeur 
50 avec son bus d'adresses 51, son bus de donnees 
52 et son bus de commande 53, qui est relie en par- w 
ticulier d un sequenceur logique 54. Le sequenceur 
est relie & une interface serie d'entree 55 et d une in- 
terface serie de sortie 56, et via un circuit d'opto- 
isolation 57 a un dispositif de commande de synthese 
de messages (non represente), qui lui envoie les 75 
adresses des messages & synthetiser. Une memoire 
de programme 58 est reliee au trois bus 51 d 53. Les 
coefficients sont stockes dans une memoire 59 reliee 
directement au bus d'adresses et au sequenceur 54 
et reliee via une porte trois etats 60 au bus de don- 20 
nees, la porte 60 etant commandee par le sequen- 
ceur 54. 

Les bus 51 & 53 peuvent etre relies a un connec- 
teur exterieur pour telecharger des coefficients ou 
modifier le programme de reconstruction, pour effec- 25 
tuer des tests ou des travaux de maintenance. 

Le sequenceur 54 est relie & un convertisseur nu- 
merique/analogique 61 suivi d'un filtre passe-bas 62 
et d'un amplif icateur basse frequence 63 dont le gain 
peut etre ajuste par un potentiometre 64. L'amplif ica- 30 
teur 63 est relie & un ou plusieurs haut-parleurs 65 et 
£ une borne de sortie haute impedance 66. 

Le traitement des effets de bords est rendu indis- 
pensable lorsque Ton utilise un niveau de decompo- 
sition important. II peut etre obtenu en rendant artrf i- 35 
ciellement impaires les trames de parole, en ajoutant 
d'un cote d'une trame de parole ou des deux cotes 
une copie d'une partie de cette trame, par exemple 
pour une trame de 256 points, on rajoute d'un cote ou 
des deux 128 points. 40 

II est possible d'adopter une modelisation auto re- 
gressive de la trame (25,6 ms) de parole voisee pour 
etendre artificiellement sa duree par une extrapola- 
tion temporelle. 

Le traitement de synthese qui est decrit ci-dessus 45 
par blocs peut etre mis en oeuvre par N f iltres disjoints 
en cascade (type vocodeur). Ce procede limite les ef- 
fets de bords dus au rafraichissement des valeurs du 
filtrage, mais penalise le processeur puisque Ton 
n'utilise pas alors les optimisations decrites lors de la so 
decomposition dyadique. 

La base orthogonale choisie est d support 
compact, ce qui optimise le temps de calcul de la 
convolution du filtrage. Les coefficients sont reels, ce 
qui permet une interpretation facile du module et du 55 
signe, et qui relaxe les contraintes liees & I'exploita- 
tion physique du modulo 2 n (lorsque la base est 
complexe). Lorsque le nombre de points utilises est 



inferieur d environ 30. on effectue une convolution 
temporelle. On peut faire appel & plusieurs bases or- 
thogonales, avec des regularites differentes. 

- la decomposition n'est pas etablie a un niveau 
donne, mais chaque filtre est adapte en largeur 
(par exemple niveau de decomposition oblique : 
analyse k Q 



constant) grace au niveau variable en fonction de 
I'optimisation liee k la parole. On peut par exem- 
ple ef fectuer un decoupage plus fin autour de 800 
Hz; 

- le choix de la regularity de I'ondelette de synthe- 
se peut par exemple etre determine par une ana- 
lyse preliminaire des trames de parole (par "on- 
delette de voisement" qui est par exemple une 
ondelette moyenne determinee & partir des trois 
classes de voisement ou la derivee troisieme 
d'une gaussienne) ; 

- trame voisee (structure harmonique) : regu- 
larity 6 a 10 environ ; 

- trame non voisee (plosives, fricatives) : fai- 
ble regularity (1 £ 6) ; 

- le reagencement des coefficients d'ondelette 
(resultat du produit scalaire) en fonction de leur 
position frequentielle permet de traiter plus faci- 
lement I'analyse temps-echelle et de la voir 
comme une analyse temps-frequence ; 

- une quantification vectorielle permet d'optimi- 
ser le debit en adaptant le codage en fonction du 
rang frequentiel et de I'energie & coder. Quelle 
que soit la methode employee (par exemple di- 
chotomie), la finalite reste toujours Telaboration 
d'un "codebook" multir6solution (un "codebook" 
etant un ensemble de vecteurs qui comportent 
toutes les "classes" ou vecteurs caracterisant le 
bary centre de nuages de points). In fine on es- 
saye de choisir une distorsion minimale (erreur 
quadratique faible) aussi peu penalisante que 
possible ; 

- le nombre de bits de codage d'un vecteur du 
code book est fonction de I'energie traitee (nom- 
bre important pour le fondamental, faible pour les 
frequences extremes). 



Revendications 

1. Procede de synthese vocale, caracterise par le 
fait qu'il cons is te & numeriser un signal vocal, d 
decouper ce signal numerise dans au moins une 
base orthogonale d'ondelettes & support 
compact, ci stockerles coefficients representatifs 
du signal vocal, et, & la restitution, & reconstituer 
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le signal vocal par f iltrage, interpolation et ampli- 
fication basse frequence. 

2. Proc6de selon la revendication 1 , caracterise par 

le fait que les coefficients sont reels. s 

3. Procede selon la revendication 1 ou 2, caracteri- 
se par le fait que le choix de la regularity de I'on- 
delette de synthase est determine par une analy- 
se pr6liminaire des trames de parole. 10 

4. Proc6de selon Tune des revendications prece- 
dentes, caracterise par le fait que pour des tra- 
mes de parole vois£e, la r£gularite de I'ondelette 

de synthese est d'environ 6^10. 15 

5. Procede selon Tune des revendications 1 & 3, ca- 
racterise par le fait que pour des trames de parole 
non vois6e, la r6gularite de I'ondelette de syntha- 
se est de 1 & 6. to 

6. Proc6d6 selon Tune des revendications pr6c6- 
dentes, caracterise par le fait que pour traiter les 
effets de bords, on rend artif iciellement impaires 

les trames de parole. 25 

7. Proc6de selon Tune des revendications prece- 
dentes, caracterise par le fait que les ondelettes 
sont des ondelettes de Daubechies. 

30 

8. Proc6d6 selon Tune des revendications prece- 
dentes, caracterise par le fait que I'on utilise des 
ondelettes bi-orthogonales. 

9. Proc6d6 selon Tune des revendications prece- 35 
dentes, caracterise par le fait qu'avant d'etre 
stockes, les coefficients sont utilises pour une 
synthese devaluation (26), et ne sont stockes 

que lorsque la qualite de restitution est jugee sa- 
tisfaisante. 40 

10. Proc6de selon Tune des revendications pr6ce- 
dentes, caracterise par le fait que le f iltrage est 
fait par convolution. 

45 

11. Proc6d6 selon Tune des revendications pr6ce- 
dentes, caracterise par le fait que pour une r6gu- 
larite superieure & environ 16, le f iltrage est fait 
par une multiplication dans Tespace frequentiel 
dual. so 
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